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【摘要 )】 回 顾 性 临床 病例 资源 丰富 , 但 是 存在 的 一 些 问 题 限制 了 临床 医师 利用 这 
些 数据 开展 临床 研究 ， 例 如 基线 资料 不 全 、 非 随机 分 组 导致 混杂 因素 多 、 失 访 率 
高 等 问题 。 采 用 限制 、 配 对 、 分 层 、 多 因素 分 析 、 倾 向 性 评分 等 多 种 方法 可 以 死 
服 回顾 性 资料 的 固有 缺陷 ， 得 出 可 靠 的 结论 。 
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[Abstract] Retrospective clinical data are abundant, but there are some problems that 
limit clinicians' use of these data for clinical research, such as incomplete baseline 
data, confounding bias due to nonrandom grouping, and higher loss of follow-up. The 
inherent defects of retrospective design can be overcome by the limitations, matching, 
stratification, multivariate analysis, propensity score and other methods. 
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回顾 性 临床 病例 资料 数据 庞大 ， 资 源 丰富 ， 如 果 临 床 医师 可 以 合理 利用 它们 
进行 临床 研究 ， 则 可 以 节约 大 量 的 时 间 和 经 颖 ,很 快 得 出 结论 和 成 果 。 但 是 回顾 
性 数据 存在 基线 数据 不 全 、 不 详细 ， 治 疗 方案 不 统一 ， 随 访 间 期 不 等 ， 失 访 率 高 
等 问题 , 所 以 需要 良好 的 研究 设计 和 统计 分 析 来 克服 这 些 缺 陷 , 才能 得 出 可 靠 的 


临床 研究 根据 有 无 人 为 设计 的 干预 因素 分 为 实验 性 研究 和 观察 性 研究 ， 观 察 
性 研究 又 根据 有 无 对 照 组 ， 分 为 描述 性 和 分 析 性 研究 ， 队 列 研究 、 病 例 -对 照 研 
究 和 横断 面 研究 是 常用 的 分 析 性 研究 设计 方法 后。 除了 不 能 进行 实验 性 研究 和 前 
脆性 队列 研究 以 外 ,回顾 性 资料 可 以 进行 病例 报道 和 病例 分 析 ， 也 可 以 进行 病例 
-对 照 研 究 、 回 顾 性 队列 研究 和 横断 面 研究 ， 所 以 可 以 设计 的 研究 类 型 是 非常 多 
的 。 例 如 罕见 病 可 以 进行 病例 报道 (<10 Pi), S10 例 的 病例 可 以 进行 病例 分 析 。 
病因 学 研究 多 采用 病例 -对 照 的 方法 进行 设计 ， 疗 效 评价 、 预 后 研究 和 病因 学 研 
究 可 以 采用 回顾 性 队列 研究 的 设计 ， 诊 断 试验 评价 可 以 采用 横断 面 研究 的 方法 。 
由 于 回顾 性 队列 研究 应 用 范围 最 广 , 所 以 下 面 重点 介绍 如 何 进行 回顾 性 队列 研究 
的 设计 和 统计 分 析 ， 以 期 达到 结论 真实 可 靠 的 目的 。 

1 回顾 性 队列 研究 设计 阶段 需要 注意 的 几 个 问题 

1.1 提出 PICO 问题 

回顾 性 队列 研究 的 基本 步骤 包括 : 明确 研究 目的 , 确立 结局 指标 和 研究 因素 ， 
提出 PICO 问题 (研究 对 象 p、 干 预 或 暴露 因素 |、 对 照 组 C、 结 局 指标 0); 确定 
研究 对 象 的 纳入 和 排除 标准 ; 计算 样本 量 ; 收集 病例 的 基线 资料 ; 随访 病例 结局 ; 
进行 统计 分 析 ， 校 正 各 种 混杂 因素 ; 总 结 、 撰 写 论 文 。 

写 出 PICO 问题 可 以 帮助 研究 者 理 清 思路 和 明确 研究 目的 ,是 非常 重要 的 。 例 
如 研究 A 基因 突变 是 否 是 急性 髓 系 白血病 复发 的 高 危 因 素 ，P〔 研 究 对 象 》 是 某 
种 类 型 的 急性 髓 系 白血病 ，| (暴露 因素 ) 是 有 A 基因 突变 ，C (对 照 组 ) 是 无 A 
FEAR, O (结局 指标 是 白血病 复发 ， 在 统计 分 析 阶 段 需 要 校正 的 因素 有 年 
龄 、 白 细胞 计数 、 原 始 细胞 计数 、 染 色 体 核 型 、 化 疗 方案 等 影响 结局 的 因素 。 

1.2 基线 数据 缺失 问题 

针对 基线 资料 不 全 这 个 缺陷 ， 在 设计 课题 阶段 可 以 采用 限制 的 方法 ， 即 设立 
纳入 和 排除 标准 ， 把 关键 资料 缺失 的 病例 排除 。 为 了 样本 有 代表 性 ， 一 般 设 立 一 
个 病例 纳入 的 年 限 , 如 纳入 2015 年 1 月 1 日 一 2018 年 12 月 31 日 的 符合 纳入 条 
件 的 所 有 病例 《连续 样本 )， 而 且 排除 标准 不 能 太 严 格 。 如 果 排 除 的 病例 较 多 ， 
最 好 进行 一 个 缺失 数据 模式 分 析 ， 如 果 是 完全 随机 缺失 或 随机 缺失 , 删 去 缺失 病 
例 对 结果 的 影响 较 小 。 也 可 以 比较 纳入 研究 的 对 象 和 剔除 的 对 象 的 基线 临床 特征 ， 
如 果 无 临床 特征 的 显著 差异 , 可 以 说 明 纳入 病例 的 代表 性 较 好 , 基本 可 以 代表 总 


体 病 例 。 

1.3 样本 量 的 计算 

回顾 性 分 析 是 否 需要 计算 样本 量 呢 ? 只 要 有 对 照 组 ， 需 要 进行 统计 学 分 析 、 
计算 P 值 的 研究 都 需要 计算 样本 量 , 因为 样本 量 太 小 , 有 可 能 得 到 假 阴 性 的 结果 。 
样本 量 的 计算 取决 于 主要 结局 指标 扬 ， 例 如 研究 某 一 疾病 的 缓解 率 、 无 进展 生存 
率 、 总 生存 率 的 样本 量 是 完全 不 同 的 ， 样 本 量 依次 递增 。 所 以 研究 中 设计 主要 结 
局 指标 和 次 要 结局 指标 很 重要 。 

1.4 配对 的 方法 

队列 研究 中 , 可 以 把 没有 某 暴 露 因素 (或 治疗 方法 ) 的 所 有 病例 作为 对 照 组 ， 
也 可 以 在 设计 阶段 , 采用 配对 的 方法 进行 对 照 组 的 选择 , 例如 进行 年 龄 、 重 要 的 
预后 因素 疾病 分 期 、 亚 型 、 并 发 症 等 ) 配对 ， 根 据 不 同 的 疾病 而 定 ， 使 两 组 可 
比 性 较 好 。 如 果 应 用 手工 配对 的 方法 ， 一 般配 对 的 因素 为 2-4 个， 否则 很 难 配 到 
合适 的 对 照 。 如 果 应 用 一 些 统计 方法 进行 配对 ,如 下 面 案 例 应 用 的 迭代 扩展 半径 
法 Citerative expanding radius matching)， 可 以 适当 增加 配对 的 因素 。 配 对 的 比例 
一 般 是 1:1 一 1:4 配 对, 超过 4 以 后 , 再 增加 配对 例 数 , 统计 效能 (Statistical Power) 
增加 不 多 。 

案例 分 析 : 发 表 在 新 英格兰 医学 杂志 的 一 项 多 中 心 、 回 顾 性 队列 研究 ”应 用 
HA 不 相合 活体 供 体 进 行 肾 移植 有 生存 获 益 ””， 其 目的 是 研究 与 单纯 等 待 的 患 
者 (或 者 等 待 后 进行 死者 供 体 肾 移植 患者 ) 相 比 ，HLA 不 相合 的 活体 供 体 肾 移植 

是 否 有 生存 获 益 。 数 据 来 源 于 美国 移植 登记 数据 库 ， 其 中 有 1025 例 HA 不 相合 
的 活体 肾 移 植 病例 ， 对 照 组 采用 1: 5 配对， 配对 因素 为 年 龄 、 性 别 、 种 族 、 既 往 
进行 肾 移 植 的 次 数 、HLA 抗体 水 平 、 有 无 糖尿 病 、 肾 脏 替 代 治 疗 时 间 7 个 因素 。 
配对 方法 采用 迭代 扩展 半径 法 。 从 单纯 等 待 未 进行 肾 移植 的 患者 中 选择 5125 例 
作为 对 照 组 1， 从 等 待 后 进行 了 HA 相合 死亡 供 体 肾 移植 中 选择 5125 例 作为 对 
照 组 2 (R 1) 。 然 后 进行 统计 分 析 ， 分 析 总 体 生存 时 间 的 差异 ， 发 现 与 等 待 患者 
相 比 ， 及 早 应 用 HLA 不 相合 的 活体 肾 供 体 可 以 提高 生存 时 间 。 

表 1，HLA 不 相合 活体 肾 移 植 患者 与 配对 的 对 照 组 的 临床 特征 比较 


HA 不 相合 活体 肾 移 植 ”单纯 等 待 未 进行 肾 移植 ”等待 后 进行 了 死亡 供 体 


患者 的 对 照 组 (N=5125) 肾 移 植 的 对 照 组 


(N=1025) (N=5125) 
移植 时 年 龄 ( 岁 ) 45. 0 土 12.8 45.9+12.1 46.6+12.0 
女性 患者 - 例 数 (Y 687 (67. 0) 3444 (67. 2) 3452 (67. 4) 
黑人 患者 - 例 数 (Y 168 (16. 4) 844 (16. 5) 840 (16. 4) 
既往 进行 过 肾 移 植 的 次 数 
- 例 数 (% 

0 612 (59. 7) 3323 (64. 8) 3321 (64. 8) 
1 350 (34. 1) 1584 (30. 9) 1552 (30. 4) 
2 57 (5.6) 202 (3. 9) 231 (4.5) 
23 6 (0.6) 16 (0. 3) 21 (0.4) 
中 位 抗体 水 平 ( 哆 -中 位 数 66 (22-94) 68 (20-95) 68 (21-95) 
(四 分 位 数 ) 
糖尿 病 - 例 数 (% 210 (20. 5) 1047 (20. 4) 1047 (20. 4) 
肾脏 替代 治疗 时 间 (E) 7.3 土 7.6 7.3 土 7.4 7.4 士 7.4 


2. 回顾 性 队列 研究 在 分 析 阶 段 需要 注意 的 几 个 问题 

在 统计 分 析 阶 段 可 以 采用 分 层 分 析 、 多 因素 分 析 、 倾 向 性 评分 等 多 种 方法 校 
正 各 种 混杂 因素 ， 以 明确 研究 因素 是 否 独立 危险 因素 或 预后 因素 。 

2.1 分 层 分 析 

在 分 析 阶 段 ， 对 一 些 最 重要 的 影响 结局 、 预 后 的 因素 进行 分 层 分 析 ， 目 的 是 
观察 消除 该 影响 因素 以 后 ， 两 组 结局 比较 是 否 有 变化 。 例 如 上 文中 ， 对 HLA pi 
体 阳性 的 不 同 水 平 进行 分 层 分 析 ， 发 现 不 同 的 抗体 水 平 下 ，HLA 不 相合 活体 供 体 
肾 移植 仍 有 生存 获 盖 

案例 分 析 : 在 一 项 比较 输血 依赖 的 骨髓 增生 异常 综合 征 应 用 去 铁 治疗 和 不 去 

否 生 存 时 间 不 同 的 研究 中 “， 结 论 是 去 铁 治疗 可 以 延长 生存 期 。 因 为 输 

血 量 是 疾病 严重 程度 的 一 个 标志 ,疾病 越 严 重 每 个 月 输血 量 越 多 , 生存 时 间 越 短 。 
所 以 对 每 个 月 输血 的 量 (<3 个 单位 红细胞 和 >3 个 单位 红细胞 ) 进行 分 层 分 析 ， 
发 现 不 同 输血 量 情况 下 ， 去 铁 治 疗 均 可 以 延长 生存 期 (图 2) ， 更 证 明了 结论 的 
可 靠 性 。 
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图 2， 去 铁 治疗 和 不 去 铁 治 疗 对 骨髓 增生 腊 常 综合 征 生 存 时 间 的 影响 
注 :不 同 的 输血 量 作为 分 层 因素 ，( a) 输血 量 科 3 个 单位 红细胞 /月 ，( b) 输血 
量 >3 个 单位 红细胞 / 月 


2.2 多 因素 分 析 

因为 影响 结局 的 混杂 因素 较 多 ， 多 因素 分 析 可 以 同时 校正 多 个 混杂 因素 ， 所 
以 多 因素 分 析 是 队列 研究 中 常用 的 统计 方法 。 常 用 的 多 因素 分 析 方 法 有 多 元 回归 
分 析 、Logistic 回归 分 析 、Cox 回归 模型 。 

这 三 种 方法 如 何 选 择 呢 ? 当 结 局 变量 为 连续 变量 时 ， 选 择 多 元 回归 分 析 。 当 
结局 变量 为 分 类 变量 ， 同 时 又 要 考虑 时 间 对 该 结局 变量 的 影响 《有 时 间 变 量 )， 
可 以 选择 Cox 回归 模型 。 当 结局 变量 为 分 类 变量 ， 不 考虑 时 间 变 量 时 ， 可 以 选择 
Logistic 回归 分 析 。 

案例 分 析 : 在 一 项 ' 老年 贫血 患者 应 用 促 红细胞 生成 素 的 治疗 反应 和 心血 管 
结局 ”回顾 性 队列 研究 中 ”， 应 用 Logi sti c 回归 分 析 应 用 促 红细胞 生成 素 后 治 
疗 反 应 的 影响 因素 , WER CCX 回归 分 析 应 用 促 红细胞 生成 素 后 心血 管事 件 的 发 生 
结局 , 研究 应 用 促 红 细胞 生成 素 后 是 否 增加 心血 管事 件 的 发 生 。 治疗 反应 的 评价 
是 统一 在 治疗 2 个 月 后 进行 评价 , 所 以 不 需要 考虑 时 间 变 量 。 而 应 用 促 红 细胞 生 


成 素 后 心血 管事 件 的 发 生 需要 考虑 时 间 变 量 , 有 的 患者 使 用 后 很 短 时 间 就 发 生 了 
心血 管事 件 ， 有 的 患者 很 久 以 后 才 发 生 心 血管 事件 。 研 究 结 论 是 : 不 论 是 不 进行 
校正 的 单 因素 分 析 [ HR=1. 21( 95°96) : 0. 88- 1. 66), P=0. 234] , 2€ 用 5 个 因素 (F 
在 其 他 血细胞 减少 、 血 红 蛋 白水 平 、 年 龄 、 性 别 、 并 发 症 指 数 ) 进行 校正 的 多 因 
素 分 析 [ HR=0. 94( 959): 0. 67- 1. 31), P=0. 693] ， 均 认为 应 用 促 红 细胞 生成 素 后 
并 不 增加 心血 管事 件 的 发 生 危 险 。 该 文 根 据 不 同 的 结局 变量 , 选择 了 2 种 多 因素 
分 析 的 方法 。 

如 何 选择 进入 多 因素 分 析 的 变量 呢 ? 从 文献 或 临床 经 验 中 确定 需要 进行 校 
正 的 因素 ， 也 就 是 可 能 会 影响 结局 的 变量 ， 可 以 进行 单 因素 分 析 进 行 初步 筛选， 
或 者 不 进行 单 因素 分 析 ， 全 部 纳入 多 因素 分 析 。 选 择 变量 时 主要 考虑 临床 意义 ， 
但 是 如 果 样 本 量 有 限 , 要 控制 进入 多 因素 分 析 的 变量 数量 ,先进 行 单 因 素 筷 选 也 
是 可 行 的 。 上 述 骨 髓 增生 异常 综合 征 应 用 去 铁 治疗 提高 生存 时 间 的 研究 中 四， 采 
用 先进 行 单 因素 分 析 ， 把 单 因 素 分 析 有 统计 学 意义 的 变量 纳入 多 因素 COX 回归 
分 析 这 种 方法 。 而 老年 贫血 应 用 促 红 细胞 生成 素 治 疗 的 文章 中 已 ， 选 择 的 5 个 校 
正 变量 , 是 根据 临床 意义 选择 的 ,未 经 过 单 因 素 分 析 筛 选 。 在 我 们 自己 的 研究 中 ， 
根据 实际 情况 ， 可 以 选择 其 中 一 种 方法 , 或 者 2 种 方法 联合 使 用 ， 同 时 考虑 单 因 
素 分 析 的 结果 ， 也 纳入 单 因 素 分 析 没 有 意义 ， 但 是 很 有 临床 意义 的 变量 。 

2.3 倾向 性 评分 法 
倾向 性 评分 方法 可 以 在 分 析 阶 段 有 效 平衡 非 随 机 对 照 研究 中 的 混杂 偏 倚 ， 使 
研究 结果 接近 随机 对 照 研究 (RCT) 的 效果 ， 所 以 有 人 称 其 为 事后 随机 化 方法 。 可 
以 应 用 倾向 性 评分 进行 配对 、 分 层 、 回 归 等 分 析 方 法 来 校正 混杂 因素 ,最 常用 的 
是 倾向 性 评分 配对 方法 .其 与 普通 配对 方法 的 不 同 是 倾向 性 评分 方法 可 以 同时 进 
行 多 个 变量 的 配对 ， 而 普通 配对 方法 的 配对 变量 是 有 限 的 。 

案例 分 析 : 费城 染色 体 阳性 的 急性 淋巴 细胞 白血病 (ALL) 应 用 Hyper- CVAD 
化 疗 方案 + 帕 纳 替 尼 与 Hyper- CVADt 达 沙 替 尼 治 疗 相 比较 ， 哪 一 个 治疗 反应 、 无 
事件 生存 、 总 体 生存 率 更 好 呢 ? 因为 两 组 基线 临床 特征 有 一 定 的 差异 , 作者 采用 
倾向 性 评分 配对 的 方法 进行 了 研究 “。 首 先 选择 配对 的 8 个 因素 : 年 龄 、 体 能 状 
态 、 白 细胞 计数 、 染 色 体 危险 度 分 组 、BCR- ABL1 的 转录 类 型 、 是 否 应 用 利 妥 萌 
单 抗 、CD20 阳性 的 原始 细胞 比例 .是 否 有 中 枢 神经 系统 累及 。 然 后 应 用 Logi sti cs 


回归 方法 计算 这 8 个 因素 的 倾向 分 值 。 再 应 用 最 近邻 居 方 法 对 评分 进行 1 1 配对 ， 
原 有 110 例 ALL 病例 , 经 过 倾向 性 评分 配对 后 , 有 41 (82 例 ) 病例 配对 成 功 。 
最 后 ， 对 这 82 例 病 例 进行 统计 分 析 ， 发 现 应 用 帕 纳 替 尼 组 无 事件 生存 和 总 体 生 
存 率 均 优 于 达 沙 替 尼 组 。 

倾 回 性 评分 方法 能 否 很 好 控制 混杂 因素 取决 于 纳入 哪些 协 变量 计算 倾向 分 
值 ， 目 前 尚 无 公认 的 标准 , 但 是 一 般 认为 应 该 纳入 所 有 的 、 己 知 的 、 可 能 影响 结 
局 的 所 有 混杂 因素 。 

2.4 失 访 率 问题 

回顾 性 队列 研究 有 失 访 是 不 可 避免 的 ， 一 般 要 求 失 访 率 控制 在 10% 之 内 ， 最 
多 不 能 超过 20%， 和 否则 会 存在 选择 性 偏 傅 ， 影 响 结 果 。 所 以 ， 要 尽量 控制 失 访 。 
如 果 有 较 多 的 病例 失 访 , 可 以 进行 敏感 性 分 析 , 把 失 访 病例 的 结局 分 别 按照 最 差 
结局 和 最 好 结局 计算 ， 如 果 结 论 没 有 显著 差异 ， 认 为 失 访 对 结论 的 影响 较 小 ， 结 
论 比较 可 靠 。 否则， 结论 的 可 靠 性 较 差 。 

3. 撰写 论文 规范 
队列 研究 属于 观察 性 研究 ， 撰 写 论文 时 要 按照 观察 性 研究 报告 规范 


(Strengthening the Reporting of Observational Studies in Epidemiology, STROBE) Kit 


行 论文 的 写作 。 详 细 的 STROBE 声明 清单 见 www.strobe-statement.org 网 站 。 在 
进行 研究 设计 之 前 应 该 先 阅 读 该 声明 , 按照 清单 上 的 内 容 进行 设计 , 才能 保证 研 
究 质 量 和 论文 质量 。 
4. 总 结 

临床 医生 可 以 利用 回顾 性 资料 进行 各 种 研究 设计 ， 根据 研 究 目的 的 不 同 选 择 
不 同 的 研究 方法 ， 回 顾 性 队列 研究 是 常用 的 设计 方法 。 两 组 不 均衡 可 比 ， 存 在 很 
多 的 混杂 因素 是 回顾 性 队列 研究 中 比较 突出 的 问题 , 可 以 应 用 上 述 介绍 的 各 种 方 
法 来 校正 混杂 因素 ， 同 一 研究 中 可 以 同时 应 用 多 种 方法 来 进行 校正 。 
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